Tensor Comprehensions
外でも動く?動かせることを目指している?
フレームワークに依存しない、高性能な抽象
コンパクト
関数定義はある
条件分岐はない
ループもない
静的型検査
カーネルを定義する
行列の掛け算や、活性化関数、らへんを簡単に定義できる 言語処理系で言えば、インタプリタから呼ばれるネイティブコードみたいなとこ
ニーズ
研究者が自分たちで考えた理論をGPU向けに走らせたい
でもネイティブコードを書くのは辛い
普通の利用者は用意されているAPIを使えば事足りるのであまり有り難みがない
autotunes
パラメータのチューニングを自動で最適化
参考